#DeepSeek AI
Token出海或迎風口!Kimi+DeepSeek+智譜+MiniMax,籌碼集中概念股出爐
AI大模型服務正面臨嚴峻的算力考驗。進入2026年,人工智慧大模型行業競爭步入白熱化階段。春節前,騰訊元寶、阿里千問、字節跳動豆包等大廠集中發力C端市場,通過各類福利活動掀起使用者“爭奪戰”。春節假期至今,全球大模型賽道融資消息也密集落地,資本熱度持續攀升。然而,伴隨使用者規模與使用頻次的激增,Token(詞元)消耗量顯著增長,大模型服務正面臨嚴峻的算力考驗。春節期間,豆包因春晚高頻互動導致算力承壓,一度暫停視訊通話功能;智譜AI等廠商也因高並行請求採取了API限流等措施。算力供給不足、推理資源緊張,已成為當前大模型規模化落地過程中亟待解決的核心難題。中國國產大模型霸榜OpenRouter自2025年初DeepSeek橫空出世、驚豔全球以來,中國大模型產業快速崛起,憑藉獨特的技術與場景優勢持續霸榜全球。據全球最大的大模型API聚合平台OpenRouter資料顯示,2月平台內前十模型總Token消耗量已突破27兆,國產模型貢獻超過14兆,市場佔比超過50%。其中,MiniMax M2.5以超過5兆的Token消耗位居全球榜首;Kimi K2.5緊隨其後,2月Token總消耗量超過4兆;DeepSeek V3.2、GLM 5分別位列第四、第八位。這些頭部國產大模型,普遍聚焦於程式碼能力與智能體(Agent)自動化任務的能力提升。從春節期間的消耗量來看,2月16日至22日(農曆除夕至正月初六),OpenRouter平台Token消耗量前十的大模型中,中國大模型份額佔比已超60%。其中,MiniMax M2.5、GLM-5 消耗量環比大幅增長,增幅分別達到197%和158%。反觀全球市場,Google、xAI、OpenAI等海外廠商旗下大模型的Token消耗量增速明顯低於國內模型,全球市場份額增長乏力,部分甚至出現負增長。Token消耗量或開啟多年增長模式Token(詞元),即AI處理資訊的最小單位。大模型每生成一個Token,後端的伺服器就得高速運轉,這不僅需要強大的算力,更需要大量的電力。根據業內測算,Token生成的成本結構中,電力及算力的成本佔比超過七成。摩根大通的報告顯示,基於使用者情境的預測,從應用採用的角度出發,Token消耗量或開啟多年增長期。中國的AI推理Token消耗量預計將從2025年的超10千兆增長至2030年的約3900千兆,增幅接近369倍,主要受兩個復合要素推動,一是隨著AI成為搜尋、內容生成、客戶服務和生產力的默認介面,AI在消費者使用者和企業工作負載中的滲透率都在提高;二是用例從對話AI擴展到智能體和多模態輸出(更長的上下文、更多的工具呼叫、更豐富的輸出),即使使用者數量增長放緩,這也會實際增加每個會話的Token。從細分領域來看,隨著時間的推移,推理需求的佔比發生明顯變化。對話AI佔2025年預期Token總消耗量的近一半,預計到2030年逐步下降至高個位數百分比;生活情景AI智能體的份額預計將從2025年的個位數提高至2030年的10%至20%。國產大模型具備電力的算力的雙重優勢對於開發者而言,性價比是硬道理。從國內來看,無論是電力還是算力,都具備顯著的成本優勢,並有望重構AI定價權。從電力來看,國家能源局資料顯示,截至2025年底,中國累計發電裝機容量達38.9億千瓦,同比增長16.1%,發電量佔全球總量的三分之一。中國也成為全球首個全社會用電量突破10兆千瓦時的國家,電力供給充足且成本優勢顯著。AI熱潮之下,美國電價呈現明顯上漲趨勢,進一步凸顯中國電力成本的競爭力。從算力來看,早在2025年10月份,央視網報導,“十四五”時期以來,中國開啟新一輪數字基礎設施大佈局,全國一體化算力網連通東西南北,算力總規模躍居全球第二,不僅為中國數字經濟的成長澆築新的基座,也創造了增長的新機遇。目前,國內多家頭部算力企業已建構起完備的適配體系,在推理環節有效突破海外技術壟斷,伺服器、光模組、散熱等關鍵硬體環節也基本實現自主可控。依託規模化部署、低成本電力供給與演算法持續迭代,國產方案在主流應用場景中的Token生產成本具備明顯優勢。業內普遍認為,國產大模型憑藉更高效的架構設計,逐步降低對高端GPU的剛性依賴;而全球開發者對中國大模型的廣泛選用,進一步拉動國產算力需求呈現爆發式增長。14隻籌碼集中大模型概念股出爐儘管在最近幾個交易日的行情中,算力類股表現有明顯分化,但不可否認的是,算力需求提升是必然趨勢。在以周度進行統計的周期中,國產大模型Token消耗量更是一度超過美國(2026年2月9日至15日),後續優勢持續擴大,多重利多因素的加持下,Token出海有望成為趨勢。證券時報·資料寶根據萬得、同花順等公開資訊梳理,A股市場中屬於智譜、Kimi、DeepSeek及MiniMax主流大模型的概念公司有140余家。從市場表現來看,截至2月27日,這140餘隻概念股今年以來平均漲幅超過13%,傑創智能、藍色游標及中控技術今年以來累計漲幅均超過60%,前2隻個股涉及智譜概念,中控技術則涉及DeepSeek概念。首都線上、金現代、優刻得-W今年以來累計漲幅均超過40%,3家公司均涉及智譜概念。從籌碼變化情況來看,最新股東戶數較2025年年末下降的概念股有14隻,3隻概念股的股東戶數下降幅度超過10%,分別是世紀天鴻、恆為科技及遠光軟體。世紀天鴻最新股東戶數較去年末下降近24%,公司以自身戰略定位和資源稟賦為出發點,結合人工智慧技術已推出了基於大語言模型研發的專注於服務老師的AI智能體“小鴻助教”,並投資了基於人工智慧NLP(自然語言處理)技術、聚焦中小學寫作場景的人工智慧輔助寫作產品“筆神作文”。恆為科技最新股東戶數較去年末下降超過21%。公司2025年2月份表示,其推出的昇騰、DeepSeek一體機分為訓推一體機與推理一體機兩種類型,以“開箱即用+高並行低時延”為核心優勢,覆蓋金融、政務、科研、醫療等眾多垂直行業,助力行業實現智能化升級。遠光軟體最新股東戶數較去年末下降10.6%。目前公司主要接入或適配了智譜、阿里千問、DeepSeek、盤古等大模型。這14隻概念股今年以來平均漲幅超過9%,恆為科技、世紀天鴻、值得買漲幅居前,均超過15%。太極股份、浪潮資訊、宇信科技表現較弱,今年以來股價均呈下跌局面,其中浪潮資訊伺服器市佔率全球領先,涉及DeepSeek及MiniMax概念。(資料寶)
Anthropic撕破臉:中國AI三巨頭"偷"了1600萬次
昨天(2026-02-23),美國AI獨角獸Anthropic突然發難,在自家部落格扔出一顆重磅炸彈——指控DeepSeek、月之暗面、MiniMax三家中國頭部AI公司通過24,000個虛假帳號,對Claude模型發動了高達1,600萬次的"工業規模蒸餾攻擊"。更戲劇性的是,馬斯克當場在X平台開炮,直指Anthropic"賊喊捉賊",還翻出了這家公司去年因盜版書籍賠償15億美元的黑歷史。這事兒看著像技術糾紛,實際上是中美AI競賽白熱化的縮影。一邊是Anthropic把技術問題上升到國家安全高度,另一邊是馬斯克揭老底式反擊。說白了,這不是簡單的"偷模型"爭議,而是OpenAI和Anthropic聯手對中國AI的圍剿開始了。📊 關鍵數字 1,600萬+ 次互動DeepSeek約15萬次 · 月之暗面340萬次 · MiniMax超1,300萬次Anthropic在報告裡列了組讓人瞠目的資料。過去幾個月,他們監測到有組織的攻擊者利用大規模代理網路(他們叫"九頭蛇叢集"架構),通過輪換IP地址和偽造請求中繼資料,繞過了平台的安全防護。光是MiniMax一家,就發起了超過1,300萬次互動,專攻Agent程式設計和工具編排能力。月之暗面也不遑多讓,340萬次互動主要衝著Agent推理和電腦視覺能力去的。最有意思的是,Anthropic聲稱通過分析請求中的技術模式、基礎設施指標,甚至對比月之暗面高管的公開資料,以"高置信度"把這三家公司揪了出來。這種溯源能力本身就很嚇人——說明AI公司對你的一舉一動瞭如指掌。2025-08 Anthropic被曝通過"巴拿馬計畫"大規模掃描數百萬本版權書籍用於訓練2025-12 Anthropic同意支付15億美元與作者群體達成和解2026-02-12 OpenAI向美國眾議院提交備忘錄,首次指控DeepSeek非法蒸餾2026-02-23 Anthropic發佈部落格正式指控三家中企"工業規模蒸餾攻擊"2026-02-24 馬斯克在X平台連發數文炮轟Anthropic"賊喊捉賊"🔧 技術拆解:所謂"蒸餾"(Distillation),說白了就是"抄作業"的高級版。讓小模型(學生)通過學習大模型(老師)的輸出來提升能力,就像學渣通過研究學霸的解題步驟來提高成績。這技術本身完全合法,甚至OpenAI自己也用。但Anthropic指控的是"工業規模"的非法蒸餾——通過2.4萬個假帳號,像工廠流水線一樣系統性竊取模型能力,這就涉及法律灰色地帶了。看到這兒你可能會問:如果中國公司是通過付費API呼叫的,這算不算 theft?這就觸及了當前AI行業最模糊的地帶。模型輸出的版權歸誰?用API呼叫結果訓練新模型,是合理使用還是侵權?現在全球都沒有明確判例。Anthropic自己也幹著類似的事——去年被曝光的"巴拿馬計畫"顯示,他們未經授權掃描了數百萬本圖書,最後不得不掏出15億美元和解。"Anthropic大規模竊取訓練資料並支付數十億美元賠償金是不爭的事實,賊喊捉賊。"—— 伊隆·馬斯克(X平台,2026-02-24)馬斯克這次開炮可謂精準打擊。他指的15億美元賠償案,正是Anthropic在2025年底因為系統性盜版書籍訓練模型,被作者群體集體訴訟後的和解金額。有意思的是,Anthropic內部給這個項目起了個諷刺的代號——"巴拿馬計畫",明顯是在影射臭名昭著的避稅天堂。一邊自己盜版書籍付天價賠償,一邊指控別人蒸餾模型,這雙標玩得確實溜。更微妙的是時間點。OpenAI在2月12日剛向美國眾議院中國特設委員會遞交了備忘錄,指控DeepSeek通過"混淆第三方路由器"非法蒸餾ChatGPT。兩周後Anthropic跟進發難,形成完美的"美國雙雄"圍剿態勢。這絕非巧合,而是精心策劃的聯合行動。💰 成本分析:Anthropic去年因盜版書籍賠了15億美元,相當於他們好幾年的營收。這次指控中國公司"蒸餾攻擊",本質上是在轉移視線——把自己的道德污點包裝成"維護智慧財產權"的正義之戰。更深層看,他們想把技術競爭上升到國家安全層面,借此推動更嚴格的晶片出口管制。畢竟,如果中國公司通過蒸餾就能獲得頂級模型能力,那美國卡晶片脖子的策略就失效了。Anthropic在報告裡毫不掩飾地緣政治意圖,直言蒸餾技術"破壞出口管制效果",甚至警告這些模型"缺乏安全護欄,可能被用於生物武器開發"。這種話術聽著耳熟——典型的"威脅國家安全"敘事套路,目的是為更嚴厲的監管鋪路。存疑:目前所有指控資料均來自Anthropic單方面披露,DeepSeek、月之暗面、MiniMax三家中國公司截至發稿均未公開回應。所謂的"高置信度"歸因,是否經得起第三方獨立驗證?24,000個帳號的技術模式,是否足以確鑿指向這三家公司,而非其他第三方行為者?Anthropic是否借技術爭議之名,行商業打壓之實?說到底,這是一場沒有贏家的戰爭。如果Anthropic的指控屬實,說明中國AI公司在技術獲取手段上確實存在爭議;但如果這只是一場精心策劃的輿論戰,那暴露的是美國AI巨頭面對中國競爭時的焦慮與恐慌。馬斯克看透了這點——與其爭論技術細節,不如直接揭穿對方的道德虛偽。耐人尋味的是,截至目前,三家被指控的中國公司集體保持沉默。這種沉默可以有多種解讀:或是默認,或是不屑回應,或是在準備法律反擊。無論如何,這場爭端標誌著中美AI競爭進入了一個更殘酷的新階段——從晶片禁令到模型蒸餾,戰場正在向技術倫理和智慧財產權領域蔓延。💡 主編觀點:這不是技術糾紛,而是商業戰爭的煙霧彈。Anthropic一邊自己盜版書籍賠15億,一邊指控別人"蒸餾"不道德;一邊享受開源社區紅利,一邊想把蒸餾技術變成"專利壁壘"。更噁心的是把技術問題硬往國家安全上扯,這種"潑髒水"套路在TikTok聽證會上已經演過一遍了。DeepSeek們是否真蒸餾了?可能有。但在這個沒有規則的遊戲裡,Anthropic沒資格當道德裁判。真正的危險不是"蒸餾",而是美國AI巨頭借監管之名,扼殺全球競爭。 (雲櫻夢海資源導航)
暴漲 263%!日均 37 兆 tokens,中國企業級大模型市場格局定局:三強領跑,頭部集中
AI 產業再迎關鍵里程碑!國際權威諮詢機構沙利文(Frost & Sullivan)最新發佈《中國 GenAI 市場洞察:企業級大模型呼叫全景研究,2025H2》報告顯示,2025 年下半年中國企業級大模型市場迎來爆發式增長,行業從早期試水全面邁入規模化落地階段,市場格局也迎來清晰洗牌。資料顯示,中國企業級大模型日均呼叫量已從 2025 年上半年的10.2 兆 tokens,激增至下半年的37.0 兆 tokens,半年內漲幅高達263%。這一跨越式增長,直觀印證了中國企業對大模型的接受度、依賴度與應用深度正在全面提速,AI 真正從 “技術概念” 變成 “生產工具”。隨著市場放量,行業競爭邏輯徹底轉變,頭部效應急劇放大,曾經熱鬧的 “百模大戰” 正式落幕,取而代之的是頭部廠商憑藉技術、生態與服務能力形成的穩定格局。三強格局固化:阿里雲領跑,字節、DeepSeek 緊隨其後報告清晰勾勒出當前中國企業級大模型市場的 TOP3 陣營,三家廠商合計佔據超七成市場份額,行業集中度顯著提升。1. 阿里雲千問(Qwen):翻倍增長,穩居行業第一作為市場領頭羊,阿里雲千問展現出壓倒性的增長勢頭。其市場佔比從上半年的17.7%大幅躍升至32.1%,近乎實現翻倍增長,持續鞏固行業第一的位置。依託阿里雲完善的雲端運算基礎設施、企業服務生態與多場景落地能力,千問在文字創作、資料處理、程式碼輔助、企業知識庫等核心場景中佔據主流,成為大量企業數位化轉型的首選大模型。2. 字節跳動豆包:高滲透力,穩居第二字節跳動豆包以 21.3% 的呼叫量佔比位列第二,保持著強勁的市場滲透力。依託字節生態的產品矩陣與高效的工程化能力,豆包在內容生成、智能助手、多模態互動等場景中廣受青睞,快速覆蓋大量中小企業與網際網路場景,成為國產大模型中使用者覆蓋面最廣的選手之一。3. DeepSeek:異軍突起,行業黑馬躋身前三作為賽道中的新銳力量,DeepSeek 憑藉突出的技術實力與開源策略異軍突起,以 18.4% 的市場份額拿下第三名。其在程式碼生成、推理效率與成本最佳化上的優勢,快速獲得開發者與企業市場認可,成為國產大模型中 “技術派” 的典型代表,也證明了差異化路線在成熟市場中依然具備突圍空間。行業大變局:從 “百模大戰” 到 “生態決勝”此次沙利文報告披露的市場資料,不僅是份額的更迭,更標誌著中國企業級大模型行業進入全新發展階段。應用落地全面提速企業對大模型的使用從 “試點測試” 轉向 “核心業務常態化呼叫”,文字創作、資料處理、程式碼輔助、內部知識庫等場景成為主流,AI 真正融入生產流程。競爭核心徹底轉變行業不再單純比拚參數、榜單成績,而是轉向生態完善度、服務穩定性、部署成本、場景適配能力的綜合較量。能為企業帶來真實降本增效的模型,才能佔據市場。頭部集中趨勢不可逆中小模型逐步退出主流競爭,資源、客戶、技術持續向頭部廠商匯聚,未來市場將長期保持 “頭部引領、細分補充” 的格局。日均 37 兆 tokens 的呼叫量,是中國企業級 AI 市場的 “成人禮”。從 2025 年上半年的試探性佈局,到下半年的爆發式增長,中國大模型產業完成了從技術創新到產業價值的關鍵一躍。阿里雲千問、字節豆包、DeepSeek 組成的第一梯隊,也為行業樹立了清晰的發展標竿。未來,隨著大模型與各行業深度融合,更高效、更普惠、更貼合產業需求的 AI 服務,將持續推動中國企業數位化、智能化升級,而這場由技術驅動的產業變革,才剛剛開始。 (相進化的猿)
AI原生應用億級俱樂部:「BAT+DeepSeek 」格局初成
隨著2026春節假期結束,中國國產AI“億級俱樂部”也正式宣告上線。根據機構最新統計及各家官方最新披露資料,豆包、元寶、千問、DeepSeek這四款應用的月活躍使用者(MAU)均已穩穩突破一億大關。也就是說,這個春節之後,國產 AI 已經正式走出了實驗室的象牙塔,越過了極客圈層的窄門,成為了真正的國民級應用工具。站在2026農曆新年的節點上回頭來復盤生成式人工智慧這近四年時間,技術的進展多少是有點“時間玄學”的。從ChatGPT在2023年1月之後開始席捲全球,到2024 年從矽谷到中國的“百模大戰”,再到2025 年春節前後DeepSeek轟動全球,可以說幾乎每一年的農曆春節,AI都出現了堪稱爆炸性的變化。2026年春節,也沒有例外。隨著中國一眾國產AI爭相上春晚、發紅包、不斷刷新應用程式商店下載記錄,這也直接意味著,2025年年末一度興起的AI泡沫論可能要暫時告一段落,人工智慧,這一次是真的開始要改變人類世界了。2013年上映科幻電影《Her》中經典場景,元寶AI生成最佳化。01拆掉AI門檻回顧網際網路發展史,任何一項新技術想要實現“全民普惠”,都必須經過春節這個中國社交能量爆發最極致的洗禮。當年的微信支付如此,短影片如此,今天的AI亦然。雖然這一輪AI革命到今年已經三年多時間,但對於絕大多數人來說,AI到底怎麼用、能用來幹嘛?大多數人還是不清晰的。更重要的是,ChatGPT一直都還有付費門檻,這把更多人擋在了門外。因此,AI想要真正成為科技革命,還有關鍵一關要過,那就是下沉。而中國網際網路科技公司最擅長什麼?從歷史經驗來看,答案很明確,那就是拆掉技術落地的門檻。在這一輪AI行銷中,率先掀起紅包浪潮的騰訊元寶,應該是這一輪“AI普惠下沉”浪潮中的典型樣本。在此之前,AI應用的普及率雖然在提升,但主要集中在職場白領與學生群體。今年春節前夕,元寶先是通過“10億紅包”的強力槓桿,利用騰訊獨特的社交生態,將AI推向了更廣泛的普通使用者和下沉民眾。除了發紅包之外,騰訊元寶還開啟了新功能元寶派。在“元寶派”的邏輯裡,AI 變成了群聊裡的“高情商搭子”和“社交潤滑劑”。它可以自動總結群組裡幾百條碎碎念,提煉出有效資訊;也可以在你和朋友陷入沉默時突然“拋梗”調解氛圍。據報導,在元寶裡領紅包的網友,有近一半來自三四線及以下城市。此外,使用者通過元寶累計完成超10億次AI創作,產品團隊在21天內迭代了159個功能。這個量級說明,大量使用者不只是被動領紅包,而是開始養成了AI的使用習慣。阿里旗下的千問,在春節前推動的用AI點奶茶邏輯和元寶是類似的。因為大家都看到了同一件事:春節只是AI應用場景的開篇,當AI真正成為了國民級技術,其競爭維度也就從演算法和智能層面的比拚,下沉到了對人類生活場景滲透率的較量。其實對於普通使用者來說,他們並不關心大模型的參數到底是多少,也不在意技術架構的演進,他們真正在意的是——AI能不能幫我一鍵生成一個有我全家名字的春聯?能不能在我忙的時候一句話幫我點一杯奶茶?能不能在群聊裡幫連電話都害怕接的賽博社恐患者回那些尷尬的親戚問候?這些在日常生活中真實存在的需求,才是AI產品革新的真正動力來源。2026 年春節的這場AI行銷大戰,說到底是一場關於“AI 互動習慣”的大規模心智植入。紅包、奶茶其實都是形式,本質是強化技術的擴散,AI 廠商們成功地讓甚至不曾聽說過“大語言模型”的下沉市場使用者,也能夠熟練地輸入提示詞,甚至通過簡單的語音指令指揮 AI 幫自己完成繁瑣的任務。更直接點說,國產AI這個春節最大的成就,是讓爺爺奶奶輩的那些以往可能連AI是什麼都不知道的使用者,開始用上了AI。02億級俱樂部今年另一個肉眼可見的變化是,AI不止是戰場變了,玩家也變了。如果說上一輪AI“百模大戰”中誕生了曾經被寄予厚望的“AI 四小龍”,那麼到了2026年的今天,行業已經進入了真正的“四強爭霸賽”。豆包、元寶、千問、DeepSeek,這四家擠進“億級俱樂部”的玩家,代表了四種完全不同的底層邏輯和進化路徑。首先來看豆包。無論是短影片使用者原創的情緒互動,還是春節前seedance2.0突破了視訊製作的新可能,它的核心邏輯是明確的,那就是內容消費的延伸,讓 AI 成為短影片生態中的新型創作者和互動者。而2025年春節的黑馬DeepSeek,則是這一輪格局中的“極客之王”。一定程度上,它甚至是“反使用者”的存在。就在過年前,關於DeepSeek最熱門的話題是,這款AI為了性能,和使用者互動時開始變得冷淡了。但從另一面來看,這證明技術本身的“純粹性”依然能夠開闢出一塊巨大的、高粘性的專業版圖。而作為阿里系的代表千問,走的是一條“AI 驅動商業閉環”的道路。從一分錢外賣奶茶到阿里的電商生態聯動,千問正在探索如何讓 AI 直接觸達消費者的錢包。它試圖回答的是:AI 到底能不能幫人買東西、幫商戶賣貨?騰訊元寶所選擇的,看起來簡單,但事實上是AI在落地處理程序中最難的一部分——AI社交。這條路,早在2025年11月OpenAI就試圖嘗試過,但ChatGPT的群聊功能上線後,並沒有帶來太多的水花,畢竟在不菲的付費牆中,它依然是極客圈層的遊戲。而從今年春節元寶的成績來看,元寶很快通過技術普惠,利用圖生圖這一類似表情包的傳播模式,打開了AI社交的更多想像空間。資料顯示,自 2 月 1 日活動上線以來,元寶的 AI 生圖能力日均呼叫量增長了30倍。除夕當天,全網通過元寶 AI 生成的微信紅包封面、拜年金色朋友圈海報成為了社交場上的“硬通貨”。這種“零門檻”的創作體驗,讓新使用者與元寶的平均每天互動問答超過了8輪。使用者通過“創作”欄完成的AI任務累計超過 10 億次。其實,從元寶到整個國產AI億級俱樂部的對比背後,也暗藏的也是國產AI與美國AI的路徑選擇分化。ChatGPT和Gemini更多聚焦於模型智能的絕對峰值,追求的是“上帝視角”下的通用解決能力,但問題是,他們都有不菲的付費牆門檻。而對比之下,中國 AI 則更多聚焦在“技術擴散”層面,即如何將最前沿的技術以最低的成本、最自然的形式接入到現有的社交、消費和內容體系中。這不僅是市場環境的差異,更是中國網際網路基因中對“應用層創新”的極致追求。也正因為這樣,可以預見的是,2026年將會是“億級俱樂部”四強的主戰場。這一年真正的考驗是,能不能在各自的賽道把產品價值做到極致。當然在億級俱樂部之外,未來也一定會湧現出更多細分、垂直的AI物種。但無論如何,2026 年的春節一定會被視為AI技術發展史上的一個分水嶺:AI從此不再是實驗室裡的程式碼,而是群聊裡、飯桌前那個不可或缺的存在。03物種大爆炸相信很多人都有類似的感受:此刻的我們,彷彿再一次站在了2011年移動網際網路萌動之初的場景之下。那幾年裡,人們還在討論KIK、米聊,用的最多的即時通訊工具,可能還是營運商的簡訊和飛信。沒人能想到,最終是一個名叫“微信”的應用,通過整合社交關係鏈、內容生態和支付體系,徹底重塑了中國人的生活。今天的AI網際網路生態,也非常類似當年微信誕生前後的“物種大爆炸”階段。從矽谷的Openclaw風行到國內的AI社交、點單,如今的AI主打一個“能用”。而且,現在的AI革命已經進入了一個技術革新和模式革新雙重驅動的階段。首先是底層技術邏輯正在發生躍遷。姚順雨加入騰訊後,在一次內部會議中的分享點出了行業未來的關鍵:未來AI to C應用的瓶頸不再是更強的模型,而是 Context(上下文)和場景(Scenarios)。當各家的基礎模型能力都達到一定水位後,技術本身就不再是不可踰越的壁壘,真正的決勝點在於:誰能更精準地捕捉、理解並利用上下文。這或許也是為什麼騰訊將重心放在了“Context Learners(上下文學習者)”這一方向。在群聊這樣高度碎片化、流式資料的社交場景中,AI所面臨的挑戰是極度苛刻的。它不是在回答一個單純的問題,而是在處理一段連續的且充滿了潛台詞以及人際關係的對話流。如果AI不能理解使用者在一個不斷有數百條消息產生的群聊中的細微語境,它就永遠無法成為真正意義的社交夥伴。比如在元寶派,當使用者試圖在一個擁有數百條消息的群聊中讓AI總結重點,或者在一段長達數月的私聊記錄中尋找某個約定的細節時,AI 面臨的挑戰是:它必須在不依賴外部通用知識的前提下,精準地理解這段封閉對話中特有的語境、人際關係和隱含邏輯。這個核心問題正是騰訊AI首席科學家姚順雨領銜的混元團隊正在重點攻克的難關。但相信技術的進化會越來越快。隨著2026 年春節這一波億級使用者的洗禮,AI的資料回饋回路已經閉環。海量的、帶有強烈中國本土社交特徵的資料,正在喂養出更懂中國人的AI模型。另外,模式創新的進化也在同步加速。除了使用者本身圖生圖的工具屬性之外,在元寶公佈的最新AI應用場景中,在元寶派裡,已經可以實現“一起看視訊”“一起聽歌”類似的強社交行為。這也意味著,AI正在超越工具、成為現實人際關係中的一個節點。從目前來看,最符合人性的AI時代的社交,一定不會是讓機器模仿人說話,而是讓機器更好介入人與人的互動。站在這個視角看,對AI取代人類的擔憂目前或許還是為時過早,因為從社交角度來觀察,AI依然是在加深人與人的連結,而非取代人類社交本身。無論如何,2026年一定會是一個關鍵時刻。就像當年移動網際網路生態的成長過程一樣,最初的領先者未必是最終的定局者,在這個物種大爆炸的時代,一切都充滿了不確定性。如果非要在當下找到確定性,那就是——AI 已經徹底改變了數字世界的運行邏輯。從這一年開始,AI網際網路的新世界,已經為我們拉開了帷幕。 (深水研究)
DeepSeek變冷淡了,然後呢?
這個春節,DeepSeek上了科技圈微博熱搜,理由有點奇怪。不是因為它發佈了什麼驚天大模型,而是因為——它變冷淡了。2月11日,DeepSeek悄悄推送了一次灰度更新。很多使用者打開App,發現那個曾經靈動、有溫度、會親切叫你暱稱的AI,突然變得爹味、乾巴、陰陽怪氣。微博熱搜第一,#DeepSeek變冷淡了#。與此同時,全網都在等一個東西:DeepSeek V4。據外媒The Information報導,V4編碼能力超越Claude和GPT系列,原定春節前後發佈。結果除夕過了,初一過了,今天大年初五了,還沒來。一個AI變冷淡,一個大模型遲遲不來,這兩件事加在一起,其實講了一個比技術參數更有意思的故事。我在一級市場,見過不少“技術上無懈可擊、商業上舉步維艱”的項目。今天想借這個春節熱點,聊聊DeepSeek這家公司,以及它背後那些被人忽略的問題。一、先說“冷淡”這件事DeepSeek這次更新,技術上是紮實進步的:上下文窗口從128K直接升至100萬Token,知識庫更新至2025年5月,首字響應速度反而還提升了。但使用者感受到的,是“變冷了”。原來會叫你名字,現在統一叫使用者。原來深度思考會洋洋灑灑,現在吐短句、風格乾硬。有人換了好幾套提示詞,找不回那種感覺了。這件事讓我想起一個做了很多年消費品的朋友說過的話:“產品的靈魂,是一致性。使用者不怕你不夠強,怕的是你變了。”在投行做項目,我們評估一個品牌資產的時候,有個維度叫“情感連接”——使用者和產品之間建立起來的那種信任與習慣。這種東西很難量化,但一旦建立,就是真實的護城河。最典型的例子是可口可樂1985年換配方那次。新配方盲測完勝原版,科學上無懈可擊,結果消費者激烈抵制,三個月後公司灰溜溜地把老配方改回來。技術層面“更好”的產品,輸給了使用者“情感上熟悉”的感受。DeepSeek去年靠R1出圈,不只是因為技術強,也因為它有“人味”:會開玩笑,回答有溫度,用起來不像在操作一台機器。這是它在使用者心裡佔的位置。這次更新,它把上下文從128K升到了100萬,卻在另一個維度上,把自己跟使用者的距離拉遠了一些。當然,這可能只是灰度測試的過渡狀態,V4正式版出來可能完全不同。但這件事本身值得記住:技術能力可以快速迭代,使用者情感不能。二、V4為什麼還沒來?按照外媒爆料,V4應該在春節前後發佈。今天是大年初五,沒有任何官方聲音。有消息說已推遲到三月底。DeepSeek官方,一如既往地沉默。有意思的是,光是“V4要來了”這個傳言,就已經在行業裡掀起了一陣亂流。一位大模型領域的從業者直接說:“傳聞DeepSeek V4很強,所以晚發不如早發,撞車等於白髮。一旦V4發佈且效果炸裂,輿論關注度會被瞬間吸乾,那時候再發模型就真的發了個寂寞。”於是春節前,國內各家大模型公司加速趕工、搶先發佈。V4還沒來,已經把整個行業逼出了一場提前量的軍備競賽。這種影響力,本身就說明了DeepSeek在行業裡的地位。這家公司有一個很特別的氣質:公眾號自2025年1月發佈R1以來,只發了10篇文章,篇篇10萬+,但絕不多說一個字。高管幾乎不公開發聲,沒有路演,沒有採訪,沒有預熱,模型發了就發了。我見過很多公司,恨不得把每一次技術更新都做成發佈會。DeepSeek這種反向操作,其實需要極大的定力。但V4遲遲不來,也說明了另一件事:大模型的研發,從來不是線性的。外界爆料的時間節點,永遠只是計畫,不是承諾。全網等V4,本質上是在等一次“去年R1震撼”的復刻。但R1之所以震撼,是因為它超越了所有人的預期。當預期本身就已經被拉滿,再強的模型,震撼感也會打折。這是一個很微妙的處境。你越成功,下一次就越難超越自己。這是任何行業的頭部玩家都繞不過去的命題。三、一年過去了,“技術突破≠商業成功”這句話還成立嗎?去年R1出來的時候,我寫過一個判斷:技術是入場券,不是護城河。一年後,這句話有了最好的現實註腳。看一組資料。QuestMobile的資料顯示,截至2025年9月,國內AI應用月活第一名是豆包,1.72億;DeepSeek是1.45億,排第二。技術上公認最強的,不是月活最高的。這不是說DeepSeek失敗了——1.45億月活是極其亮眼的成績。但它說明,在應用層面,“好用”和“最強”之間,還有很長一段距離。豆包在做什麼?字節用火山引擎登上今年春晚舞台,把AI能力直接推向全民場景;阿里拿下多個衛視春晚獨家冠名,把通義千問送進全國客廳;騰訊拿出10億真金白銀為元寶鋪路。這些打法,DeepSeek一個都不玩。這不是DeepSeek不會,是它不想。它選擇的路,是用開源建生態、用技術說話、用論文影響同行。這條路是對的,但它收益的方式,和大廠砸錢買使用者的方式,根本不是同一個賽道。從投行的視角來看,這是兩種完全不同的商業模式:一種是直接變現,一種是平台生態。前者短期見效,後者長期壁壘更深。DeepSeek選的是後者,但這意味著短期內,月活和收入資料,不會是它最好看的那張牌。平台生態這條路,歷史上走通的案例都有一個共同特徵:先做開發者,再做企業,最後才是C端消費者。Android用了將近十年才真正確立生態優勢。DeepSeek開源才一年,這個周期還早得很。四、那普通人應該關心什麼?每次DeepSeek有新動靜,很多人都會問這樣的問題:這個AI會不會取代我?我的回答一直沒變:AI取代的,是不思考的重複動作,不是判斷力。但今年,我想在這個回答後面加一句話。DeepSeek這次更新,上下文升到100萬Token,意味著它可以一次性讀完你整個公司的文件庫,處理你半年的郵件,消化一個完整項目的所有程式碼。這不是輔助工具的量級了,這是可以替你做大量資訊處理工作的量級。在投行做盡調的時候,有一種工作叫資訊整合——從幾百份檔案、幾十個資料來源裡,把關鍵資訊拼成一張完整的圖。這種工作,AI現在做得比人快。但有一件事,AI做不了:判斷這張圖意味著什麼。在資訊不完整的情況下做決策,理解對方真正的動機,在談判桌上感知那些沒有說出口的東西。所以我想說的是:不要焦慮AI變強,要焦慮的是自己有沒有在練那些AI永遠替代不了的能力。DeepSeek變冷淡了,使用者覺得少了什麼。這個“少了什麼”,恰恰是人類最獨特的東西:溫度,情感,連接。它用一次灰度更新,不小心證明了這件事。五、最後說一句大年初五,V4還沒來,熱搜是“DeepSeek變冷淡了”。這個春節檔,DeepSeek沒有按照所有人期待的劇本走。但我覺得這反而是一件值得尊重的事——它在做自己認為對的事,不管外界怎麼等、怎麼催、怎麼猜。一家在全球AI競爭最激烈的時刻,還能保持這種定力的公司,不管V4什麼時候來,我都願意繼續關注它。只是希望它發佈的時候,能把那股子“人味”找回來。畢竟,技術可以追,溫度不好複製。 (Linda產業筆記)
中國國產AI重估之年:紅包、奶茶、Seedance2.0、DeepSeek
技術的真正意義,不在於其孤立的機械成就,而在於它如何被整合進生活的整體,並在此過程中擴散至整個社會機體,從而改變文明的質感。—— 劉易斯·芒福德,《技術與文明》2026年的春節,國產AI領域呈現出一種莫名的“折疊感”。一邊是社交媒體上關於DeepSeek“變冷淡”的討論。使用者發現,這個曾在去年春節期間以“平替OpenAI”姿態破圈的先行者,如今的對話風格變得極其精簡、機械,甚至拒絕在廢話上浪費那怕一個Token。另一邊,中國網際網路大廠們在春節檔已經開啟了熱戰模式:阿里通義千問豪擲數億元請全國人民喝“AI奶茶”,字節跳動的Seedance 2.0以電影級的視訊生成能力席捲創作者圈、就連馬斯克都不斷在X上保持關注,騰訊元寶、百度文心的“搶紅包”更是一浪接替一浪。如果說 2024 年和 2025 年是 AI 的“幻覺期”,人們沉浸在 AGI 即將降臨的狂喜與恐懼中;那麼 2026 年的春節,則標誌著AI正式跨越了那道名為“有用性”的鴻溝,真正成為一次產業革命。回想2025年末AI泡沫的討論。今天我需要思考的是,冷熱之間,到底正在發生什麼?01DeepSeek拒絕討好型人格先來看國產AI黑馬DeepSeek。在AI產品裡,存在一種根深蒂固的“討好型人格”。為了讓大模型說出貼心、得體、充滿人情味的“漂亮話”,開發者往往需要通過大規模的RLHF(基於人類反饋的強化學習)對模型進行精密微調。這意味著什麼?意味著需要僱傭海量的標註員去對齊人類的感性偏好,消耗巨大的算力去磨平邏輯中的棱角。對於大多數旨在成為“超級助理”的產品來說,這種討好是通往C端市場的入場券。但DeepSeek選了另一條路。回看DeepSeek的崛起,梁文鋒曾有過無數次機會將其打造成一個“國民級App”。在2025年春節DeepSeek震驚全球、流量如潮水般湧入時,如果按照傳統的網際網路邏輯,他們完全可以迅速推出社交裂變功能、搶佔辦公套件市場、引入各種生活服務介面,甚至通過狂砸廣告來留住那些被“平替”概念吸引而來的泛使用者。但他選擇了極度的克制。到今天為止,DeepSeek的介面依然保持著一種近乎簡陋的極簡主義,沒有冗餘的社交入口,沒有華麗的行銷活動。這種拒絕,源於梁文鋒更大的戰略野心:他想做的從來不是AI時代的超級流量入口,而是AI時代的“核動力引擎”。從目前來看,在DeepSeek的邏輯裡,看起來更希望的是把每一分算力都應該被消耗在邏輯鏈條的推理(CoT)上,而不是消耗在客套話和語氣助詞上。這種“機械感”和“冷淡”,本質上是思維透明化的代價。這種對“思考質量”的極致追求,意味著它主動放棄了對泛C端使用者情緒的迎合,轉而尋求與那些真正需要解決複雜問題的開發者、科研工作者和極客們達成深層次的“邏輯共鳴”。當然,討好還是冷淡其實並無對錯,而意味著兩種不同的朝向AGI未來的探索道路。支援deepseek不提供情緒價值,但同時也不是說在否定情緒價值的重要性,而是生態分工位的不同。從產品視角觀察,梁文鋒想做的,大機率不是 AI 時代的超級流量入口,要不然,在去年春節Deepseek震驚全球時,他們就可以開始了。他希望的,應該是真的能突破技術極限,去探索 MoE(混合專家模型)的邊界,去嘗試在有限的資源下復現甚至超越 OpenAI 的推理能力。對於DeepSeek而言,使命不是做一個“好用的聊天機器人”,而是做一個“最聰明的智能引擎”。這是生態位的差異。02DS之外:紅包、奶茶、seedance2.0這就要繼續說回最近大廠的春節AI大戰。我們要意識到,今天的AI 產業正進入一個深度的分工期。在做面向C端的應用上,國內的網際網路大廠們——字節、阿里、騰訊、百度、美團——顯然更有經驗。他們擁有現成的流量入口、深厚的使用者心理積澱,以及極其成熟的營運體系。他們更懂得如何把 AI 變成一個貼心的助理、一個懂你的玩伴、或者一個高效的生產力工具。如果要求 DeepSeek 這樣一家極客色彩濃厚的技術公司,去和大廠比拚如何做“情緒價值”“場景落地”,這不僅是對人才的浪費,更是戰略上的錯位。大廠們擅長的是“降維打擊”,將成熟的技術包裝成絲滑的產品;而 DeepSeek 的價值在於“升維突破”,去攻克那些無人區裡的演算法難題。芒福德在《技術與文明》中強調,技術的真正價值在於其擴散過程,而大廠們恰恰是這一過程的超級加速器。首先是“奶茶、紅包、外賣”所代表的流量邏輯。對於絕大多數普通使用者來說,AGI的宏大敘事太過遙遠,但一杯實實在在的、由AI下單的奶茶外賣卻非常具體。大廠們深諳此道,他們擁有現成的流量入口、深厚的使用者心理積澱,以及極其成熟的營運體系。通過這些看似“沒技術含量”的玩法,AI正迅速從極客的玩物變成一種全民級的生活方式。其次是Seedance 2.0所代表的生產力飛躍。字節跳動最新發佈的Seedance 2.0,實現了單指令生成多場景、音畫同步的電影級視訊。這不再僅僅是“提供情緒價值”,而是將導演、攝影、剪輯的功能端到端地壓縮排一個模型中。這標誌著AI應用已經跨越了簡單的對話階段,進入了影視工業和社媒行銷的深水區。放眼全球AI競賽,中美兩國正在呈現出截然不同的演進範式。如果說矽谷更傾向於在“Scaling Law”的加持下追求全能型的通用智能,試圖一舉攻克算力與智慧的塔尖;那麼中國AI則正在呈現一種“多元突進”的混戰局面:一端是以DeepSeek為代表的技術原教旨主義,在算力受限的極限壓強下,通過演算法創新死磕推理深度與成本極限;另一端則是以大廠為核心的應用生態,利用全球最肥沃的商業土壤,將AI迅速轉化為奶茶、短劇、視訊工具等觸手及人的互動節點。這種分工不僅不是衰退,反而是一種極具韌性的系統性對抗。我們不應輕易否定任何一端。沒有DeepSeek式的底層突破,國產AI將永遠失去“入場券”,在全球算力競賽中淪為附庸;而如果沒有大廠在紅包、奶茶、Seedance 2.0上的應用突圍,領先的技術也將因缺乏商業閉環而枯萎,無法惠及普羅大眾。03真正的下半場從商業進化的視角看,這已經非常像技術周期進入下半場後的必然分化階段。幾乎可以斷定的是,大模型的“驚豔期”過去,市場開始進入殘酷的“重估期”:我們正在從對通用大模型的盲目崇拜,轉向對不同生態位的精準錨定。正如芒福德所言,一項技術的生命力最終取決於它的擴散能力與整合深度。DeepSeek的“冷”與大廠應用的“熱”,本質上是同一場技術革命在不同維度的硬核迴響。這種分化不僅標誌著中國AI企業戰略路徑的清晰化,更預示著一個多層次、差異化競爭的成熟生態正在形成。從技術發展的長軸來看,2026 年春節的這場分化並非偶然。在每一次科技革命的中段,都會出現類似的“重估期”:從對技術本身的崇拜,轉向對技術所創造的價值的重塑。當蒸汽機離開礦井,裝上車輪成為火車,裝入工廠成為織布機,將孤立的技術奇蹟擴散為全球貿易的毛細血管;當 TCP/IP 協議的爭論告一段落,真正的戰場便轉移到了瀏覽器、搜尋引擎與電子商務等具體應用場景。現在的AI革命正處於這個關鍵的“中段”。這意味著我們已經不再滿足於討論 AI “能做什麼”,而開始死磕 AI “在做什麼”。太陽底下無新事,這樣的場景,其實我們經歷過很多次。所以也沒有必要過於擔心AI對人類的替代,當年電燈出現時、汽車出現時,這種擔憂都出現過。但事實證明,人不是不被需要了,而是更加能夠發揮價值了。2026年春節的這場“冷熱交替”,是AI產業最為真實的成人禮。而值得慶幸的是,中國AI公司們,整體表現都不錯。 (深水研究)
全網都在猜DeepSeek V4的發佈時間,但中國模型激戰還有一條暗線
傳言會在春節期間發佈的DeepSeek V4,還沒現身。2026年1月初,外媒援引了兩名直接瞭解Deepseek發佈計畫的知情人士消息,稱DeepSeek計畫在春節期間推出其下一代旗艦模型V4。一石激起千層浪,2025年春節前夕,DeepSeek曾發佈了震撼全球的 R1 模型,導致美股AI類股劇烈波動,也樹立了中國開源模型以性能逼近全球頂尖閉源模型,效率和性價比超越閉源模型的信心。在爆料傳出前後,DeepSeek團隊密集發表了兩篇由創始人梁文鋒署名的重磅論文,被業內視為V4發佈的“預演”:1月1日發佈的mHC(流形約束超連接),解決了模型越大訓練越容易崩潰的穩定性難題 ;1月12日聯合北大發佈的Engram(條件記憶),讓模型面對熟悉知識時直接查表呼叫,把算力留給真正需要深度推理的複雜任務 ,同時實現計算與記憶體解耦。這些跡象更讓開發者和分析師堅信,DeepSeek已經完成了V4的技術儲備。野村證券甚至在2月10日的報告中,提前預告DeepSeek將於2月中旬發佈V4,指出V4的重點不在於參數競賽,而在於通過Engram和mHC技術打破晶片和視訊記憶體瓶頸。開發者在DeepSeek的FlashMLA開源推理庫中發現了一個代號為“MODEL1”的程式碼標識。它的架構參數與目前的 V3 有顯著差異。這被技術圈解讀為V4正在進行最後的工程部署測試。技術社區流傳著一句笑談,整個中國AI圈都在緊鑼密鼓地準備“V4陪你過春節”。01. DeepSeek V4何時來?然而截至發稿,DeepSeek V4還是沒有正式發佈。但是在2月11日,有使用者發現,DeepSeek的App版本號更新為1.7.4,離線狀態下可呼叫的知識庫截止時間為2025年5月,更值得注意的是,模型的上下文窗口從128K提升至1M(100 萬 Tokens),儘管上下文翻了8倍,但首字生成速度反而有所提升,體驗非常絲滑。同時,模型的表達風格發生了明顯的變化,大量使用者吐槽回覆變得“爹味”或“冷淡”,失去了V3版本那種靈動、幽默的對話感。從社交媒體來看,大部分人認為這就是V4的“搶先體驗版”或“性能閹割版”,提前灰度測試,再發佈完整版。有開發者猜測,DeepSeek這次灰度測試的其實有兩個大小不同的版本。小版本參數量200B左右,大版本參數量達到1.4T。而大參數量的版本,性能應該是對標Claude Opus4.6的。而且,從目前放出的版本來看,依然沒有“多模態”。DeepSeek還是在繼續堅持純語言路線。但是,接近DeepSeek的人士透露,“這不是V4,就是一個小版本更新。”2025年春節開始,DeepSeek一直處於聚光燈下,但是卻低調地可怕。DeepSeek的公眾號自2025年1月20日更新R1之後,一共發佈了10篇文章,篇篇10w+,置頂的是《DeepSeek-V3.1發佈,邁向Agent時代的第一步》。只有模型版本的更新會發佈官方公眾號,而重要論文、開源成果等,僅發佈arXiv和官方程式碼倉庫。全年幾乎沒有任何高管公開對外發出除了技術分享之外的聲音。所以,這次萬眾矚目的DeepSeekV4春節發佈,成了一場“全民猜猜看”遊戲,官方一直沒有任何回應。02. V4魅影之下,沒人敢鬆懈國產晶片及大模型基礎設施廠商,是DeepSeek新版本發佈前最積極的“猜猜看”參與者之一。能否在V4發佈的第一時間提供完整適配支援,已成為檢驗廠商技術實力與服務響應速度的試金石,也直接決定了能否搶佔流量紅利的第一波紅利窗口期。各個廠商的人互相打聽DeepSeekV4發佈的時間,但是所有人都沒有確切消息。一家國產晶片廠商的工程師說:“DS這個沒人知道確切時間,都在等著它降臨。”“DeepSeek給到的資訊太少了,但是就是有預警,我們都得帶著電腦回家。”另外一家晶片廠商同樣表示在時刻準備著DS的發佈。還有傳言表示,DeepSeekV4會在大年三十或大年初一直接“炸場”。全行業都在S級預警中,準備在春節期間,做Day0(24小時之內)窗口期適配。03. 激戰的國產大模型與DeepSeek靜悄悄相對應的是,整個大模型行業,早已經卷了起來。從Kimi K2.5於1月27日發佈 ,選擇的時機很好,正值個人Agent開源框架OpenClaw大火。這個由Peter Steinberger打造的本地自託管AI助手項目,兩周內在GitHub突破15萬Stars,而K2.5的特性恰好與之高度契合。K2.5具有原生多模態視覺編碼能力,以及可自主調度多達100個子智能體、平行處理1500個步驟的Agent叢集(Agent Swarm),近兩周後便以1.16兆token的周呼叫量登上了OpenRouter總榜榜首,超過Gemini 3 Flash和Claude Sonnet 4.5。隨後,開源社區中,一個神秘的Pony Alpha模型於2月初以“匿名模型”的方式出現在OpenRouter,主打編碼、推理和智能體工作流最佳化 ,可以執行長程Agent任務和複雜系統工程,總參數744B、啟動參數僅40B,首次整合DeepSeek Sparse Attention大幅降低部署成本 ,2月11日被智譜官方確認就是GLM-5 ,智譜官方也特別強調,GLM-5的模型體感可以對齊Opus4.5。隨著GLM-5的官宣,智譜港股近四日累計漲幅超110% ,僅2月12日當天就一度漲超41%,收盤漲28.68%,總市值達1792億港元。智譜在上線GLM-5的同時,也宣佈GLM Coding Plan套餐漲價30%起,被長江證券解讀為國產大模型從“燒錢拓客”階段正式進入需求驅動時代。就在同一天,MiniMax悄悄上線M2.5,啟動參數量僅10B,每秒輸出100 token的情況下連續工作一小時僅需1美元,官方稱具備了“像架構師一樣思考和建構”的能力,期待能夠加速全面Agent時代的到來。股價在過去五個交易日累計上漲約35%。同樣也在模型官宣稿件中提到,綜合來看,M2.5與Opus4.5表現相當。Openclaw的火爆是一個偶然也是一個必然,AI創業者Jayden提到:“行業太需要一個for個人的、開源的Agent框架,不是Openclaw也會是別的。”這個純靠技能、記憶與API協議持續工作的“無頭智能體”從概念走向可用,從需求側倒逼了大模型的能力演進方向:Agent的自主規劃、多步工具呼叫、長期上下文記憶特性,再加上7×24小時常駐運行的需求,讓Token消耗從傳統問答式的零散消耗,變成規模化、持續性的巨量消耗直接將模型競爭的核心維度推向了“Agentic工具編排能力、長程任務規劃、持久化記憶與超長上下文處理”這一新範式。在這一範式下,ClaudeOpus4.6的能力是行業公認的天花板。從各方猜測來看,對DeepSeekV4的期待,也是能夠追趕或者拉平Opus4.6的能力,同時性價比更高。在DeepSeekV4之前,各家模型廠商,已經開始搶佔這個賽道。“很關鍵的一點,傳聞DeepSeek V4很強,所以晚發不如早發,撞車等於白髮。所以大家現在的策略就是‘搶跑’,趁著超級頭部還沒扔‘核彈’之前,先把自己的牌打出去。一旦DS V4發佈且效果炸裂,輿論關注度會被瞬間吸乾,那時候再發模型就真的‘發了個寂寞’了。”一位大模型演算法工程師說。“太累了,即使不在公司,也得帶著電腦。但是沒辦法,現在也是一個範式的升級期,如果不證明自己跟上了步伐,後果很可怕。”開源社區也有各種爭論,國產模型的使用體感還是和Opus4.6差太多。但是,2026年上市的大模型公司智譜AI和Minimax,市值都已經衝擊2000億港元大關。“Agentic(智能體化) 是預訓練和RL+PostTrain(後訓練強化學習)之後第三個模型比較大的範式。而我們在這裡面又看到了開源模型的SOTA,資本市場認可的主要是這個邏輯。”一名券商首席分析師指出。置頂的DeepSeek文章,突出的也是“Agentic”。DeepSeekR1引發上一波熱潮,也是大模型上一個範式進化之時。國產大模型激戰背後,DeepSeek給到的壓力只是一方面,另外一條更重要的暗線是,在範式轉換之時,沒有一家大模型廠商“敢掉隊”,保持在牌桌上至關重要。最後,還有一個問題,不按常理出牌的Deepseek,真的會陪我們過春節嗎? (騰訊科技)
春節見?DeepSeek下一代模型:“高性價比”創新架構,助力中國突破“算力晶片和記憶體”瓶頸
野村證券認為DeepSeek即將發佈的新一代大模型V4,可能通過創新架構mHC和Engram技術進一步降低訓練和推理成本,加速中國AI價值鏈創新周期。同時有望幫助全球大語言模型和AI應用企業加速商業化處理程序,從而緩解日益沉重的資本開支壓力。野村證券指出,DeepSeek即將發佈的新一代大模型V4,預計不會像去年的V3一般引發全球AI算力需求的恐慌。但它可能通過兩項底層架構創新,加速全球大語言AI應用的商業化處理程序。華爾街見聞提及,據報導DeepSeek新一代旗艦模型V4預計將於2026年2月中旬面世。內部初步測試表明,V4在程式設計能力上超過了目前市場上的其他頂級模型,如Anthropic的Claude和OpenAI的GPT系列。一個核心問題再次浮現:V4會再次顛覆全球AI價值鏈嗎?野村證券在2月10日發佈的《全球AI趨勢追蹤》報告中給出了明確的判斷:不會。研報指出,這次發佈的意義在於V4可能通過創新架構(mHC和Engram技術)進一步降低訓練和推理成本,加速中國AI價值鏈創新周期。同時有望幫助全球大語言模型和AI應用企業加速商業化處理程序,從而緩解日益沉重的資本開支壓力。01 創新技術架構帶來性能與成本最佳化報告指出,算力晶片和記憶體一直是中國大模型的瓶頸。而V4有望引入的兩項關鍵技術——mHC和Engram,從演算法和工程層面針對這些硬約束最佳化。mHC:全稱為“流形約束超連接”。它旨在解決Transformer模型在層數極深時,資訊流動的瓶頸和訓練不穩定的問題。簡單說,它讓神經網路層之間的“對話”更豐富、更靈活,同時通過嚴苛的數學“護欄”防止資訊被放大或破壞。實驗證明,採用mHC的模型在數學推理等任務上表現更優。(超連接與流形約束超連接)Engram:一個“條件記憶”模組。它的設計理念是將“記憶”與“計算”解耦。模型中的靜態知識(如實體、固定表達)被專門儲存在一個稀疏的記憶體表中,這個表可以放在廉價的DRAM裡。當需要推理時,再去快速尋找。這釋放了昂貴的GPU記憶體(HBM),讓其專注於動態計算。(Engram架構)研報指出這兩項技術的結合對中國AI發展意義重大。用更穩定的訓練流程(mHC)彌補國產晶片可能存在的不足;用更聰明的記憶體調度(Engram)繞過HBM容量和頻寬的限制。野村強調V4最直接的商業影響就是進一步降低大模型的訓練與推理成本,這種成本效益的提升將刺激需求,屆時中國AI硬體公司將受益於加速的投資周期。02 硬體受益於“加速周期”野村認為全球主要雲服務商正全力追逐通用人工智慧,資本開支的競賽遠未停歇。因此V4預計不會對全球AI基礎設施市場造成去年那種等級的衝擊波。不過全球大模型及應用開發商正背負著日益沉重的資本開支負擔。V4若能如預期般,在維持高性能的同時顯著降低訓練與推理成本,將成為一劑強心針。它可能幫助這些玩家更快地將技術轉化為收入,緩解盈利壓力。報告回顧了DeepSeek-V3/R1發佈一年後的市場格局。此前DeepSeek的兩個模型V3和R1的“算力管理效率”疊加“性能提升”加速了中國LLM與應用發展,也改變了全球與中國大語言模型競爭格局,並推動開源模型更受關注。(OpenRouter上排名前15的開源模型每周Token消耗量)在2024年底,DeepSeek的兩個模型曾佔據OpenRouter上開源模型Token使用量的一半以上。但到了2025年下半年,隨著更多玩家加入,其市場份額已顯著下降。市場從“一家獨大”走向了“群雄割據”。這表明,僅憑單一模型的高效,已不足以統治快速演進的開源生態,如今V4面臨的競爭環境,遠比一年前複雜。03 軟體或迎來“增值而非被替代”在應用側,更強大、更高效的V4將催生更強大的AI智能體。報告觀察到,像阿里通義千問App等,已經能夠以更自動化的方式執行多步驟任務。這意味著,AI智能體正從“對話工具”轉型為能處理複雜任務的“AI助手”。這些能執行多工的智能體,需要更頻繁地與底層大模型互動,這將消耗更多的Token,進而推高算力需求。因此,模型效能的提升不僅不會“殺死軟體”,反而為領先的軟體公司創造了價值。野村強調,需要關注那些能率先利用新一代大模型能力,打造出顛覆性AI原生應用或智能體的軟體公司。它們的增長天花板可能因模型能力的飛躍而被再次推高。 (硬AI)